FILTER MODE ACTIVE

#бенчмарки ИИ

Найдено записей: 7

#бенчмарки ИИ30.07.2025

MiroMind-M1: Новый уровень открытого математического интеллекта с многоэтапным обучением с подкреплением

MiroMind-M1 представляет открытую платформу для продвинутого математического анализа, используя инновационное многоэтапное обучение с подкреплением для достижения передовых результатов и полной прозрачности.

ЧИТАТЬ →

#бенчмарки ИИ24.07.2025

GPT-4o Видит Текст, Но Видит ли Он Ясно? Исследование Многоформатных Моделей в Задачах Компьютерного Зрения

Исследование EPFL оценивает многоформатные модели, включая GPT-4o, на ключевых задачах компьютерного зрения, выявляя их сильные стороны в семантическом понимании и отставание от специализированных моделей.

ЧИТАТЬ →

#бенчмарки ИИ24.06.2025

Кризис оценки ИИ: почему старые тесты не работают и что будет дальше

Традиционные бенчмарки перестают адекватно отражать реальные способности ИИ. Появляются новые методы оценки, такие как LiveCodeBench Pro и Xbench, которые предлагают более точное измерение возможностей моделей.

ЧИТАТЬ →

#бенчмарки ИИ11.06.2025

Mistral AI представляет серию Magistral: передовые LLM с цепочкой рассуждений для бизнеса и открытого ПО

Mistral AI представила серию Magistral — новые большие языковые модели, оптимизированные для рассуждений и мультиязычности, доступные в открытом и корпоративном вариантах.

ЧИТАТЬ →

#бенчмарки ИИ05.06.2025

NVIDIA представила ProRL: длительное обучение с подкреплением улучшает рассуждения и обобщение в ИИ

NVIDIA представила ProRL — новый метод обучения с подкреплением, который за счет увеличения длительности тренировки раскрывает новые способности к рассуждению в моделях ИИ и показывает высокую эффективность на различных тестах.

ЧИТАТЬ →

#бенчмарки ИИ30.05.2025

Biomni: революционный ИИ Стэнфорда для автоматизации биомедицинских исследований

Стэнфордские исследователи представили Biomni — универсального биомедицинского ИИ-агента, который автоматически выполняет разнообразные задачи, интегрируя специализированные инструменты и данные, превосходя экспертов в ключевых тестах.

ЧИТАТЬ →

#бенчмарки ИИ02.05.2025

MiMo-7B от Xiaomi: компактная модель ИИ, превосходящая большие аналоги в математике и программировании

MiMo-7B от Xiaomi — компактная языковая модель, которая благодаря продвинутому предобучению и обучению с подкреплением превосходит более крупные модели в задачах математики и программирования.

ЧИТАТЬ →